AI032
Programación de procesadores paralelos masivos: un enfoque práctico
Análisis de rendimiento y ejecución SIMT
Objetivos de aprendizaje
- Evaluar la eficiencia del modelo de ejecución SIMT en cargas de trabajo paralelas
- Identificar cuellos de botella de rendimiento relacionados con la divergencia de ramificaciones y la serialización
- Analizar técnicas de ocultamiento de latencia de memoria dentro de la planificación de warps
- Calcular métricas de utilización y ocupación para núcleos de GPU